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ГРУППОВОЙ АНОНИМНОСТИ 


У статті розглянуто задачу забезпечення групової анонімності, запропоновано модифікацію меметичного 
алгоритму її розв'язання, яка передбачає його виконання у дві фази, що дозволяє поліпшити якість 
розв'язків. Застосування алгоритму продемонстровано за допомогою прикладу на основі реальних даних. 
Ключові слова: групова анонімність, меметичний алгоритм, мікрофайл. 


Іа бе агіїсіє, а та5К ої ргомійте єгопр апопутату 15 дізси85ед. А. плодійсайоп ої Бе плетейс аїєогійрт ог 
зоЇуіпя, 16 15 ргезепіеа. ТБе плодійсайоп йапріез сагуїпе Ше аїсогіївт оці іп бо рба5е5, у"Бісі епабієе8 ц5 
го обіаїп Бієрбег дцайсу 50Гийопя. Арріїсайоп ої Фе аїсогіїпта 15 Шизігаїед млі а геа! Чака Ба5ед ехатріє. 
Кеу уогаії: огопр апопупаїу, плетейс аїдогійрт, плістоїіє. 


В статье рассматриваєтся задача обеспечения групповой анонимности, предлагаєтся модификация 
меметического алгоритма ее решения, предусматривающая его исполнение в две фазьк, что позволяєт 
улучшить качество решений. Применениє алгоритма демонстрируєется с помощью примера на основе 
реальньх данньіх. 

Ключевкье слова: групповая анонимность, меметический алгоритм, микрофайл. 


Вступ 


Оскільки людина - - істота соціальна, більшість її вчинків залежить від сприйняття 
тих, чия думка становить для неї найбільшу вагу. Часто особа не готова розкривати 
інформацію про цих людей, що може пояснюватися суб'єктивними факторами чи 
природою її оточення (релігійна громада, ЛГБТ-спільнота тощо). 

Постає задача приховання належності особи певній групі, що можна сформулювати 
як задачу маскування певних характеристик особи (1), тобто як задачу забезпечення 
індивідуальної анонімності, де під анонімністю розуміють властивість суб'єкта бути 
неідентифіковним у множині інших суб'єктів. Можна поставити пов'язану задачу 
забезпечення групової анонімності (ЗЗГА), у рамках якої потрібно приховати інформацію 
не про особу, а про групу осіб (наприклад, замаскувати територіальний розподіл даних 
про групу військовослужбовців). 

Метод забезпечення групової анонімності даних має задовольняти умови |21: 

1. Ризик розкриття інформації після модифікації даних низький. 
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2. Аналіз початкових та захищених даних повинен давати близькі результати. 

3. Вартість модифікації даних прийнятна. 

У загальному випадку, забезпечити анонімність можна шляхом вилучення 
певних атрибутів (наприклад, «Військова служба») із мікрофайлу. Такий підхід 
найпростіший, проте він задовольняє тільки третю умову з наведених вище. Другу 
умову він задовольняє меншою мірою: аналіз даних з урахуванням вилученого 
атрибута стає неможливо провести в принципі. Окрім цього, як показано в |3-41, цей 
підхід у певних випадках не задовольняє першої умови: існує можливість 
сформувати так звану нечітку модель групи, за допомогою якої можна оцінити 
ступінь належності деякого запису групі шляхом аналізу загальних атрибутів («Вік», 
«Стать» та ін.), вилучення яких неприйнятне. Отже, для повноцінного забезпечення 
групової анонімності потрібно застосовувати додаткові модифікації даних. 

Підходи до розв'язання ЗЗГА можна розділити |3| на ті, що передбачають 
одержання розв'язку в два етапи, та ті, що передбачають його одержання в один 
етап. Двоетапні методи передбачають одержання модифікованого розподілу, що 
маскує чутливі властивості групи, а потім модифікацію первинних даних із метою 
приведення їх у відповідність до модифікованого розподілу. Якщо на розв'язок 
ЗЗГА не накладати додаткових обмежень, можна одержати модифіковані розподіли, 
еквівалентні з погляду маскування чутливих властивостей даних. При цьому різні 
модифікації вестимуть до одержання на другому етапі спотворень різного обсягу. 

Як альтернативу можна використовувати одноетапний підхід до розв'язання 
ЗЗГА, згідно з яким потрібно одержати модифікований розподіл, який одночасно 
задовольняє накладені на нього обмеження щодо маскування чутливих властивостей 
даних і веде до спотворень мінімального обсягу. За такого підходу ЗЗГА є складною 
задачею умовної оптимізації, і для її розв'язання запропоновано |3| використовувати 
меметичні алгоритми (МА) |6), які, як правило, реалізують у вигляді еволюційних 
алгоритмів із додаванням процедур локального пошуку | 71. 

Можна виділити чотири |7-8| способи врахування в еволюційному алгоритмі 
обмежень, які накладають на розв'язок оптимізаційної задачі: 

1. Штрафні функції, що зменшують пристосованість недопустимих розв'язків. 

2. Коригуючі функції, що трансформують недопустимі розв'язки в допустимі. 

3. Звуження пошуку до підпростору допустимих розв'язків шляхом 
використання спеціальної схеми кодування для подання особин у популяції. 

4. Декодувальні функції, що відображають недопустимі розв'язки на 
допустимі, трансформуючи таким чином пошуковий простір. 

У загальному випадку на розв'язок ЗЗГА не накладають інших обмежень, 
окрім маскування чутливих властивостей даних, тому доцільним є використання 
штрафних функцій. Але різні обмеження можуть вести еволюційний процес у різних 
напрямах, 1 не завжди в напрямі найменших спотворень. 

Метою даної роботи є побудова двофазового меметичного алгоритму 
розв'язання ЗЗГА, на першій фазі якого визначають початкові обмеження та 
одержують наближені розв'язки, на другій -- аналізують ці розв'язки, уточнюють 
обмеження та одержують остаточні розв'язки. 
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Задача забезпечення групової анонімності 

Нехай дані організовано у вигляді мікрофайлу М, записи г якого, і-іІ,р, 
містять значення атрибутів у», /-І,п. Позначимо через уу, множину значень уу,. 
Позначмо через м, 7-11, сутнісні атрибути. Сутнісну комбінацію значень можна 


визначити як елемент із уу, Х...ХУ, . Позначмо через У ро ) множину цих 

комбінацій. Записи, значення яких належать У, називатимемо сутнісними. 

Позначмо через у", параметризуючий атрибут, значення якого називатимемо 

параметризуючими. Позначмо через Р-В,Р,,...,В ) множину параметризуючих 
, 


значень. За допомогою цих значень можна розбити М на підмікрофайли МІ,,...,М, . 
р 


Позначмо через С (У, Р) групу респондентів, дані про яку потрібно захистити. 


Групу визначають значення параметризуючого та сутнісних атрибутів мікрофайлу. 
Задача забезпечення групової анонімності полягає |5| в модифікації М задля 
маскування чутливих властивостей даних про групу. Позначмо через О(м,с) 


цільове подання (ЦП), яке подає властивості даних про С у зручний для маскування 


спосіб. ЗЗГА полягає в підборі перетворення Ал0(м,с)-зо (м", С), одержанні 


модифікованого ЦП О/ і модифікованого мікрофайлу М. У роботі працюватимемо 

з ЦП у вигляді кількісного сигналу 4-(4,4.»:...4, ), Де 4, -- число сутнісних 
і 

записів у М,, і-1,/,. Під чутливими властивостями розумітимемо викиди 4. 


Будь-яке перетворення 4 повинно забезпечувати два види модифікації даних: 
1. Сигнал 4 потрібно модифікувати для маскування викидів з урахуванням 


накладених на його значення обмежень, які на практиці є нечіткими |З). 

2. М потрібно привести у відповідність із модифікованим сигналом шляхом 
попарного обміну сутнісних та несутнісних записів між підмікрофайлами, 1 при 
цьому повинно бути внесено спотворення мінімального обсягу. 

Обсяг спотворень оцінюють за допомогою визначальної метрики |5): 


о (г И,) Хоб 

івім (ро Й Уа Ом), а) 
ре "(1 же (7,) ХА 

де І, (./,) -- рий порядковий (К-ий категорійний) визначальний атрибут 

(атрибут, розподіл значень якого становить інтерес для дослідників), г) повертає 

значення вказаного атрибута запису г, ХУ,» У» ) - - оператор, що дорівнює у, , якщо 

у, та у, належать одній категорії, та у, - - інакше, (о, та у, -- невід'ємні ваги, які 


підбирають, виходячи з важливості атрибута (що він важливіший, то більша вага). 


Меметичний алгоритм 


Розглянемо перетворення А у вигляді наступного меметичного алгоритму (51: 
1. Випадковим чином згенерувати популяцію ре з цу особин, і-1,. 
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Застосувати оператор локального пошуку 5 (С ;) Мі -Іш ; 


Обчислити значення функції пристосованості / (С |) Мі зі й 


Якщо виконується умова завершення, зупинити алгоритм. 
Вибрати 2. пар батьківських особин; помістити їх у множину Р". 


Фу ль ооо о 


Застосувати оператор рекомбінації К(С0/,Г, ,) до кожної пари особин 
сова су з де1,М, і 21, й і, ; помістити нащадків у множину Р". 

7. Застосувати оператор мутації М (0 5) ушіуео -1,М. 

8. Застосувати 5 (0 ;) до кожної особини з Р", )-1,2.. 


9. Обчислити значення функції пристосованості /! (0 ;) му -1,М. 


10. Вибрати у пристосованіших особин із РР"; додати у Р замість 


поточних. 
11. Перейти на крок 3. 
Кожна особина в Р є матрицею Ї/ з О рядками та 4 стовпцями: 


1. Елементи першого (третього) стовпця и, Мі -|,О відповідають індексам 
підмікрофайлів, із яких потрібно вилучити (у які потрібно додати) сутнісні записи. 

2. Елементи другого стовпця и, визначають індекси записів із МІ, , які 
потрібно вилучити. Елементи четвертого стовпця и, визначають індекси записів із 
М,,, » які потрібно обміняти з записами, визначеними и), . 


Кожна особина М однозначно визначає розв'язок ЗЗГА. 
У даній роботі пропонується використовувати функцію пристосованості 


гоУ(0)Ф(О)Я(О), (02) 
де У((/) -- оцінка розв'язку з погляду мінімізації обсягу спотворень, Ф(П/) -- 
штрафна функція -- оцінка розв'язку з погляду маскування викидів, и ) о 


штраф, уведений для упередження необмеженого збільшення числа рядків в 
особинах. Значення кожного множника з (2) повинні лежати в проміжку 0,1). 


Як М (С ) доцільно використовувати оператор, який є суперпозицією 


М «М,оМ,оМ,оМ, операторів, що діють на кожний стовпець (/ окремо. 


Двофазовий меметичний алгоритм 


Для деякого елемента д можна визначити обмеження одного з двох типів: 


1. Спадне обмеження, функція належності якого монотонна незростаюча, що 
прямує до І зі спадом значення елемента до заданого порогового значення. 

2. Зростаюче обмеження, функція належності якого монотонна неспадна, що 
прямує до І зі зростанням значення елемента до заданого порогового значення. 

На початку розв'язання ЗЗГА можна визначити тільки спадні обмеження для 
підмікрофайлів, із яких потрібно вилучити записи. Вибір підмікрофайлів для 
додавання записів (та відповідних зростаючих обмежень) є неоднозначним, і його 
можна перенести на еволюційний процес відповідно до такої процедури: 
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1. На підставі аналізу 4 сформувати спадні обмеження для тих його елементів, 


які порушують вимогу щодо маскування викидів сигналу. 

2. Виконати МА. 

3. Розділити одержані особини на допустимих (сумісні з обмеженнями та 
маскують викиди), майже допустимі (сумісні з обмеженнями, але не маскують 
викидів) та недопустимі (не сумісні з обмеженнями). 

4. Згрупувати в кластери всі майже допустимі особини, для яких можна задати 
однакові зростаючі обмеження (одна особина може належати декільком кластерам). 

5. Вибрати кластер із найменшим середнім значенням (1); якщо він містить 
менше у особин, збільшити його розмір до у випадковим копіюванням особин; 


якщо більше ц особин, зменшити його розмір до ц випадковим видаленням особин. 


6. Застосувати МА до множини особин, одержаної на кроці 5. 
Перші два кроки становлять першу фазу МА, решта чотири - - другу фазу МА. 


Методика забезпечення групової анонімності 


Розглянемо методику забезпечення групової анонімності, яка, окрім 
забезпечення анонімності у спосіб, описаний вище, враховує випадок забезпечення 
анонімності груп, відносно яких існує загроза її порушення шляхом аналізу значень 
несутнісних атрибутів мікрофайлу. В останньому випадку анонімність групи можна 
порушити за допомогою її нечітких моделей: на основі сторонніх даних |3| або на 
основі експертних знань |4|. Методику можна застосовувати, якщо дані мікрофайлу 
зберігаються в текстовому файлі, де кожний рядок відповідає певному респонденту, 
а значення в рядку відповідають значенням атрибутів цього респондента. 

Методику забезпечення групової анонімності можна розбити на етап побудови 
моделі групи, етап побудови нечіткої моделі групи на основі сторонніх даних, етап 
побудови нечіткої моделі групи на основі експертних знань, етап розв'язання ЗЗГА. 

На етапі побудови моделі групи потрібно вибрати мікрофайл М, визначити 
сутнісні та параметризуючі атрибути, обчислити значення ЦІ та визначити викиди. 

На етапі побудови нечіткої моделі групи на основі сторонніх даних потрібно за 
допомогою моделі перевірити, чи має місце загроза порушення анонімності у 
випадку вилучення з М сутнісних атрибутів. Для цього потрібно вибрати 
допоміжний мікрофайл М |3| та виконати гармонізацію М та М з одержанням 
гармонізованих М" та М" з ідентичною структурою атрибутів. Якщо М вибрати 
неможливо, потрібно перейти на наступний етап методики. Наступною є 
ідентифікація вхідних змінних системи нечіткого виведення |3|, що є основою 
нечіткої моделі, а також побудова її бази правил. Після цього потрібно збудувати 
ЦП, що відповідає нечіткій моделі, та визначити в ньому викиди. Якщо викиди 
відповідатимуть викидам початкового ЦП, існує загроза порушення анонімності. 
Якщо збудувати базу правил неможливо, можна перейти на етап розв'язання ЗЗГА. 

На етапі побудови нечіткої моделі групи на основі експертних знань потрібно 
за допомогою моделі перевірити, чи має місце загроза порушення анонімності у 
випадку вилучення з М сутнісних атрибутів. Після побудови моделі згідно з |4| 
потрібно побудувати ЦП, що їй відповідає, та визначити його викиди. Якщо викиди 
відповідатимуть викидам початкового ЦП, існує загроза порушення анонімності. 

На етапі розв'язання ЗЗГА в різних випадках потрібно використовувати різні 
ЦП: у випадку загрози порушення анонімності за допомогою однієї з нечітких 
моделей групи -- ЦІ, що відповідає цій моделі; у випадку відсутності такої 
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загрози-- початкове ЦП. Якщо з М вирішено не вилучати сутнісних атрибутів, 
ЗЗГА додатково потрібно розв'язати для початкового ЦІЇ незалежно від того, чи 
існує загроза порушення анонімності за допомогою будь-якої з нечітких моделей. 

Для оцінювання якості розв'язків ЗЗГА з погляду маскування викидів ЦІЇ 
потрібно сформувати спадні обмеження. Для оцінювання якості розв'язків ЗЗГА з 
погляду мінімізації внесених спотворень потрібно визначити параметри метрики (1). 

Для розв'язання ЗЗГА потрібно застосувати описаний вище МА. По 
завершенню його роботи потрібно відібрати з числа особин останнього покоління 
допустимі. Якщо таких не виявлено або їхня якість незадовільна, потрібно виконати 
другу фазу МА. Якщо після її виконання розв'язок одержати неможливо, МА варто 
перезапустити, змінивши окремі його параметри. Після відбору розв'язку потрібно 
виконати модифікацію М., яка передбачає виконання фізичного обміну записів М,а 
також запис даних модифікованого мікрофайлу у файл відповідного формату. 


Практичні результати 


Розгляньмо задачу маскування територіального розподілу військовослужбовців 
штату Массачусетс, США. Як початкові дані, було взято мікрофайл перепису 
населення США 2000 р. (10), що містить 141 838 записів. Вважатимемо, що загроза 
порушення анонімності за допомогою нечіткої моделі відсутня. 

Для визначення групи як сутнісний атрибут було взято «Військову службу», 
сутнісне значення -- «1» (відповідає «Поточній службі»), параметризуючий 
атрибут -- «Місце роботи», значеннями якого є коди статистичних областей штату 
Массачусетс, параметризуючі значення - - кожне десяте значення від 25010 до 25120 
(ці значення відповідають кодам статистичних областей штату Массачусетс). 

Кількісний сигнал 4 представлено на рисунку І. Елементи 1-12 відповідають 


областям 25010-25120. Анонімність можна забезпечити шляхом зменшення 2, 7, 9 та 
12 значень сигналу, тобто на відповідні значення модифікованого сигналу 4 


потрібно накласти спадні обмеження, які характеризуються наступними функціями 
належності: и, (х)- ХМЕ (х, 20,67), и. (х)- 2МЕ (х, 25,30), и, (х)- 2МЕ (х, 25,28), 


1, хха 
2 
З й зазоіннй. 
и» (2)є МЕ (х, 25,38), де 2МЕ (х,а,Б)- б є 
29 5 и 
Ь-а 2 
0, х2еб 


Порогові значення обмежень обрано з метою зменшення значень відповідних 
елементів сигналу до рівня, зіставного з величиною найменшого викиду, яким є 7-ий 
елемент сигналу. Індекси 2, 7, 9 та 12 було вибрано як індекси, що можуть входити в 
1-ий стовпець особин у популяції в МА, інші індекси - - у 3-ій стовпець. 

Для мінімізації обсягу внесених спотворень як визначальні атрибути було взято 
«Стать», «Вік», «Іспанське чи латиноамериканське походження», «Сімейний стан», 
«Рівень освіти», «Громадянство», «Сукупний дохід». Кожний атрибут вважався 
категорійним. Для спрощення інтерпретації (1) було вибрано наступні її параметри: 
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учіЇ Ук-еі?, хач1, Х,20. Метрика (1) у цьому разі показує кількість значень 


атрибутів, які потрібно модифікувати за один обмін записів між підмікрофайлами. 


70 


60 


Рис. 1. Початковий кількісний сигнал (суцільна лінія), модифікований сигнал з 
метрикою 37 (штрих-пунктирна), модифікований сигнал з метрикою 38 (пунктирна) 


Функція пристосованості (2) першої фази алгоритму має наступний вигляд: 


2 
1099- У У ізн М, (ца) МУ, (ша) 
0 нн вн ПО оо 


де //, -- К -ий визначальний атрибут, к-1,7, М у (Й, ) -- оператор, який повертає 


значення атрибута Й/, і-го запису підмікрофайлу М,, останній доданок - - 


штрафний терм, який дискримінує особин із кількістю рядків, більшою за 100, 
С ах - - найбільше можливе сумарне значення (1), обчисленої для всіх парв (/. 


Як оператор рекомбінації було вибрано оператор, описаний у |35|. Як оператори 
мутації М, та М, було обрано мутацію обміну |11Ї, М, та М, -- мутацію 
випадкової заміни |, с. 43|. Як локальний пошук було вибрано оператор, описаний у 
П12|. Як метод відбору було вибрано турнірний відбір | 13, із турніром розміру 5. 

Першу популяцію було ініціалізовано шляхом випадкової генерації матриць із 
різною кількістю рядків. Елементи 1-го стовпця генерувалися з імовірностями, 
пропорційними відповідним значенням 4, 3-го -- імовірностями, пропорційними 
числу записів у відповідних підмікрофайлах. Інші параметри МА було обрано так: 
р-100, 2-40, імовірність рекомбінації р, -І, р, ЗР, 7 Р», 7 Фу, 70,001, параметр 


локального пошуку (див. |12|) р,,, 20,75. Для упередження передчасної збіжності 


МА імовірність мутації збільшувалася вдесятеро щоразу, коли середньоквадратичне 
відхилення пристосованостей ставало меншим за 0,03. 

Було виконано 30 запусків МА. МА припиняв роботу після генерації 1000 
популяцій. Серед 3000 особин, одержаних за результатами першої фази, 754 особини 
(25,1339о) є допустимими. Середнє значення сумарної метрики (1) по всіх 


176 О Д.Ю. Тавров, О.Р. Чертов 


155 1561 - 5359. Штучний інтелект, 2015, Ж» 1-2 


допустимих особинах дорівнює 57,901. Більшість особин майже допустимі (1337, 
або 61,2339/). Їх було розбито на кластери, найбільші з яких наведено в таблиці І. 


Таблиця 1. Кластери, одержані після першої фази МА 


Елементи сигналу для збільшення | Розмір кластера Середня метрика 
1 та 6 78 45,436 
3 та б 84 46,048 
3 та 10 26 46,269 
4 та 6 43 48,488 
6 та 8 183 46,519 
8 та 10 101 44,238 


Для другої фази доцільно вибрати особини з останнього кластеру. Можна 
сформувати обмеження, що зростають, з наступними функціями належності: 
1, х«15 


й (х)-ро (хує 


, | 
1-2 ХО з1аха27 
12 


0, х227 


Порогові значення функцій вибрано так, щоб у модифікованих сигналах, 
сумісними з обмеженнями з високим ступенем, початкові викиди було масковано (39- 
е та 10-е значення стануть співмірними зі значеннями з індексами 2, 7, 9 та 12). 

Функція пристосовності (2) другої фази алгоритму має наступний вигляд: 


о 7 
1099-53 /У/зівлі| М, (ш» 7, )- МУ, (ша, ) 
со (0)- рагу о (о о) 
до 1099 Пе | 1знед(дугз0) 

Серед 3000 особин 2693 (39,76790) є допустимими. Два розв'язки з найменшою 
сумарною метрикою (1) представлено на рисунку І. Середнє значення метрики по 
допустимих особинах дорівнює 47,373, тобто для анонімізації достатньо змінити не 
більше за 0,00595 значень атрибутів мікрофайлу. Ці результати ліпші від одержаних 

у 151, що свідчить про ефективність двофазового підходу до розв'язання ЗЗГА. 


Висновки 


У роботі запропоновано модифікацію меметичного алгоритму розв'язання 
задачі забезпечення групової анонімності, яка передбачає виконання алгоритму у дві 
фази: на першій фазі формуються початкові обмеження на розв'язок задачі, а на 
другій їх уточнюють з урахуванням результатів виконання першої фази. 

Застосування двофазового алгоритму до реальних даних свідчить, що для 
анонімізації даних мікрофайлу достатньо змінити не більше за 0,005 значень його 
атрибутів. Цей результат ліпший від одержуваного за допомогою однофазового 
алгоритму, що підтверджує практичну корисність запропонованої модифікації. 
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ВКЕ5СМЕ 
Ю. У. Таугоу, О. В. Спегіоу 
Тууо-Рразе Метегіс Дісогійпт Їог Ргоуідіпеє рака Стопр Апопутісу 

Жом/адауз, її пає Бесоте а сопатоп ргасіїсе їо ргоміде рибіїс ассе55 о уагіоця Кіпаз8 ої 
ргітагу поп-аботераїеа 5іанзиса! Чака. Месеззагу ргесаціїоп5 оцебії о Бе їаКеп іо ємагапіее Шаї 
зеп5ійує дата Беахигез аге пла5Кей, апа Чака ргімасу саппої Бе міоіаїей. 

Іп са5е ої ргоїесііпо пабогтабоп абоці а ягопр ої реоріе, її 15 ппрогіапі їо ргоїесі іпітіп8іс 
Чаїа Геаїшгез. То до 50, її 15 обіїсакогу їо шігодисе а сегіаїп Ісусі об аї5іогіїоп їпіо ре Маїа. 
Міпітітіпє (різ фізїогіїоп 15 а согаріех орітігайоп (аз, муріср сап Бе 50Іуед Бу арріуштеє 
арргоргіаїе Бешті5йїс іесппідцез, е.є., плетейіс аЇ огіт8. 

Іл Бе рарег, ууе ргоро5е а плодійсаноп ої Фе плетейс аїсогійрт бог 50Іміпо, ре (а5к ої 
ргомійтпе, єгопр апопутайу. Тре подїей аїсогіїйт сопзі8їє ої буо ріаз8е8, мПпеге оп Фе Нг58ї 
рбазе шіца! сопбігаттів оп Фе 50Габіоп аге 5їаїед, апа оп Фе зесопа рба5е Шеу аге гейпей ц5іпе 
їре дага обіаїпед а8 їре тези ої ре Пт5і ріазе. 

МУе Шизігаїе Бе арріїсаноп ої їде бууо-ріа5е аїсогійнт Бу 580Іміпе а каз ої ргоміате 
стор апопупитїу Базей оп геа! даїа. 


Д. Ю. Тавров, О.Р. Чертов 
Двухфазньїй меметический алгоритм обеспечения групповой анонимности 

На сегодняшний день все чаще предоставляют публичньй доступ к различньм 
первичньм  неагрегированньюм  статистический  данньм. При дзтом необходимо 
предпринимать мерьт для маскирования чувствительньїх к раскрьтию особенностей 
данньхх с тем, чтобьї предотвратить нарушение приватности данньхх. 

В случає защить информации о группе лиц, важно защищать присущиє им 
особенности. (того  невозможно  достичь без внесения в даннье  искажений 
определенного | обьема. | Минимизация таких  искажений  являєтся | сложной 
оптимизационной задачей, для решения которой можно применять соответствующиє 
звристические методьі, например, меметические алгоритмі. 

В статье предлагаєтся модификация меметического алгоритма решения задачи 
обеспечения групповой анонимности. Модифицированнь й алгоритм состоит из двух фаз, 
при зтом на первой фазе формируются начальнье ограничения на решения, а на второй 
они уточняются на основе данньхх, полученньтх по результатам первой фазь. 

Применение двухфазного алгоритма проиллюстрировано путем решения задачи 
обеспечения групповой анонимности, основанной на реальньтх данньхх. 
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